DiTo - Ein Diagnostik-Werkzeug für die syntaktische Analyse

نویسندگان

  • Judith Klein
  • Ludwig Dickmann
  • Abdel Kader Diagne
  • John Nerbonne
  • Klaus Netter
چکیده

In this paper we present a testing tool for the diagnosis of errors in NLP Systems. We discuss briefly the relevance of testing tools for NLP Systems and advocate the idea of modular testing tools. liere we present an approach for the syntax component of NLP Systems. Our diagnostic tool for German syntax is an effort to construct a catalogue of syntactic data exemplifying the major syntactic patterns of German that Supports the diagnosis of errors. Up to now, the catalogue contains the areas verbal government, coordination and although not yet completed fixed verbal structures.We cooperate with other groups that work on further syntactic phenomena according to the ideas of DiTo. To allow systematic testing of specific areas of syntax the data are organised into a relational database. Motivation und Ziele Bei der Entwicklung natürlichsprachlicher Systeme müssen den Entwicklern Testmengen zur Verfügung stehen, anhand derer sie die Performanz der Systeme kontrollieren können. Durch die modulare Architektur natürlichsprachlicher Systeme besteht die Möglichkeit, *Diese Arbeit wurde durch einen Forschungszuschuß, ITW 9002 0, vom Deutschen Bundesministerium für Forschung und Technologie an das DISCO Projekt am DFKI und durch IBM Deutschland Projekt LILOG-SB an der Universität des Saarlandes finanziell unterstützt. IAI (Institut für angewandte Informationswissenschaft), Projekt EUROTRA in Saarbrücken und Institut für Computerlinguistik an der Universität Koblenz IAI (Institute for Applied Information Science), project EUROTRA in Saarbrücken and Institute for Computational Linguistics at the University of Koblenz

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

SEMAT - Ein Werkzeug zur Ontologiebasierten Analyse und zum Vergleich von Prozessmodellen

Zusammenfassung: Die automatisierte syntaktische und semantische Analyse von Prozessmodellen ist für viele Anwendungszwecke wie z.B. für das Prozessbenchmarking wünschenswert. Aufgrund der Vielzahl unterschiedlicher Modellierungssprachen und divergierender Verständnisse des modellierten Realitätsausschnitt jedoch meist nicht direkt zu realisieren. In diesem Beitrag wird eine prototypische Umset...

متن کامل

RaceVis: Ein Werkzeug zur Visualisierung von Data Races

Die Entwicklung und Wartung von nebenläufigen Programmen ist schwierig und fehleranfällig. Fehlende oder falsche Synchronisation kann zu komplizierten Fehlerszenarien führen, die dem Quelltext nur schwer anzusehen sind, jedoch katastrophale Auswirkungen auf die Programmausführung haben können. Durch statische Programmanalyse können alle Quelltextpositionen identifiziert werden, an denen bestimm...

متن کامل

Effiziente Modellierung von 2D-Polygonen auf Touchscreens

—Die neuen Benutzerparadigmen von Tablet-PCs, die mit Touchscreens ausgestattet sind, erfordern ein Umdenken bei der Gestaltung von Benutzerschnittstellen. Die Modellierung unregelmäßiger Polygone ist ein wichtiger Anwendungsfall und ein Beispiel für den Balanceakt zwischen Flexibilität und Benutzerfreundlichkeit. Wir beschreiben ein Werkzeug, das die Modellierung nach dem " Scheren-Paradigma "...

متن کامل

Syntaktische Strukturen - Eigenschaften und Zusammenhänge

In diesem Beitrag wird nach dem Muster der bereits aufgestellten und erfolgreich überprüften synergetisch-linguistischen Modelle im Bereich der Lexik (Köhler 1986; Hammerl 1991; Gieseking 2003) und der Morphologie (Köhler 1990a, 1990b, 1991; Krott 1996, 2003) ein Basismodell eines syntaktischen Subsystems der Sprache erstellt und empirisch überprüft. Für die theoretische Modellierung wird von z...

متن کامل

Visuelles Wissensmanagement mit adaptierbaren Dokumentenlandkarten

Dokumentiertes Wissen zu analysieren, zu strukturieren und zu organisieren ist ein wichtiger Bestandteil des Wissensmanagements. In der Literatur sind sogenannte Dokumentenlandkarten zur Visualisierung der inhaltlichen Ähnlichkeitsstruktur eines Textkorpus vorgeschlagen worden. Ausgehend von einem empirischen Aufgabenmodell wird in dieser Arbeit ein adaptierbares Rahmenmodell zur Generierung vo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 1992